Spring Cloud—七、容错保护:Hystrix

Author Avatar
zuoqy 11月 21, 2018
  • 在其它设备中阅读本文章

7.1、分析

举个例子,在一个电商网站中,我们可能会将系统拆分成用户、订单、库存、积分、评论等一系列服务单元。用户创建一个订单的时候,客户端将调用订单服务的创建订单接口,此时创建订单接口又会向库存服务来请求出货(判断是否有足够库存来出货)。此时若库存服务因自身处理逻辑等原因造成响应缓慢,会直接导致创建订单服务的线程被挂起,以等待库存申请服务的响应,在漫长的等待之后用户会因为请求库存失败而得到创建订单失败的结果。如果在高并发情况下,因这些挂起的线程在等待库存服务的响应而未能释放,使得后续到来的创建订单请求被阻塞,最终导致订单服务也不可用。

在微服务架构中,存在着那么多的服务单元,若一个单元出现故障,就很容易因为依赖关系而引发故障的蔓延,最终导致整个系统的瘫痪,这样的架构相比较传统架构更加不稳定。为了解决这样的问题,产生了断路器等一系列的服务保护机制。

针对上述问题,Spring Cloud Hystrix实现了断路器、线程隔离等一系列服务保护功能。它也是基于Netflix的开源框架Hystrix实现的,该框架的目标在于通过控制那些访问远程系统、服务和第三方库的节点,从而对延迟和故障提供更强大的容错能力。Hystrix具备服务降级、服务熔断、线程和信号隔离、请求缓存、请求合并以及服务监控等强大功能。

7.2、雪崩效应

在微服务架构中通常会有多个服务层调用,基础服务的故障可能会导致级联故障,进而造成整个系统不可用的情况,这种现象被称为服务雪崩效应。服务雪崩效应时一种因“服务提供者”的不可用导致“服务消费者”的不可用,并将不可用逐渐放大的过程。

如果下图所示:A作为服务提供者,B为A的服务消费者,C和D是B的服务消费者。A不可用引起了B的不可用,并将不可用像滚雪球一样放大到C和D时,雪崩效应就形成了。
雪崩效应.png

7.3 Hystrix简介

主页:https://github.com/Netflix/Hystrix/
Hystrix.png
Hystrix是由Netflix开源的一个延迟和容错库,用于隔离访问远程系统、服务或者第三发库,防止级联失败,从而提升系统的可用性与容错性。Hystrix主要通过以下几点实现延迟和容错。

1.包裹请求:使用HystrixCommand(或HystrixObservableCommand)包裹对依赖的调用逻辑,每个命令在独立线程中执行。这使用到了设计模式中的“命令模式”。
2.跳闸机制:当某个服务的错误率超过一定阈值时,Hystrix可以自动或手动跳闸,停止请求该服务一段时间。
3.资源隔离:Hystrix为每个依赖都维护了一个小型的线程池(或者信号量)。如果该线程池已满,发往该依赖的请求就被立即拒绝,而不似乎排队等候,从而加速失败判定。
4.监控:Hystrix可以近乎实时地监控运行指标和配置的变化,例如成功、失败、超时、以及被拒绝的请求等。
5.回退机制:当请求失败、超时、被拒绝,或当断路器打开时,执行回退逻辑。回退逻辑可由开发人员自行提供,例如返回一个缺省值。
6.自我修复:断路器打开一段时间后,会自动进入“半开”状态。断路器打开、关闭、半开的逻辑转换,前面已经详细探讨了,本节不再赘述。

7.4、原理说明

正常情况:正常情况.png

当对特定服务的呼叫达到一定阀值时(Hystrix中的默认值为5秒内的20次故障),断路打开,不进行通讯。并且是一个隔离的线程中进行的。
Hystrix情况.png

7.5、快速入门

在springcloud-demo-order系统中增加Hystrix实现容错。

7.5.1、导入依赖
1
2
3
4
<dependency>
<groupId>org.springframework.cloud</groupId>
<artifactId>spring-cloud-starter-hystrix</artifactId>
</dependency>
7.5.2、修改ItemServe的queryItemById方法
1
2
3
4
5
6
7
8
9
10
11
@HystrixCommand(fallbackMethod = "queryItemByIdFallbackMethod")//进行容错处理
public Item queryItemById(Long id) {
String sericeId = "springcloud-demo-item";
String url = "http://" + sericeId + ":/item/query/" + id;
return this.restTemplate.getForObject(url,Item.class);
}

// 请求失败执行的方法
public Item queryItemByIdFallbackMethod(Long id) {
return new Item(id,"商品查询错误",null,null);
}
7.5.3、在启动类SpringcloudDemoOrderApplication添加@EnableHystrix注解

SpringcloudDemoOrderApplication.png

7.5.4、重新启动进行测试

测试结果.png
测试一切正常。
接下来,我们把商品服务停止进行测试:
测试结果.png
可以看到,订单服务正常,但是查询商品服务已经停止服务,查询到的是错误信息。

由此可见,商品服务的宕机并没有影响订单服务的正常工作,起到了容错效果。


出自:zuoqy博客
如若转载请注明出处!